📦 RAG Vector Base Writer v7 🚀

Управление базами
знаний AI агента

Комплексная система для работы с векторными базами данных. Загружайте документы, обрабатывайте контент с помощью AI, векторизируйте и ищите семантически. Полная интеграция с системой самообучения.

API Endpoints

Режима работы

Типов файлов

Векторных БД

768

Размер вектора

📄 Мультиформатная загрузка

🤖 AI-фрагментация

🧬 Векторизация Gemini

🔄 Self-Learning Stats

😤 Проблемы управления знаниями

Почему ручное наполнение базы знаний — это боль

📁

Разрозненные форматы

Документы в PDF, Word, Excel, презентациях... Каждый формат требует своего парсера. Собрать всё вместе — часы ручной работы.

✂️

Неправильная фрагментация

Разбить текст на чанки просто? Нет. Разорвать посреди мысли — убить семантику. Слишком большие куски — плохой поиск.

🔍

Плохой семантический поиск

Без качественных эмбеддингов и правильных индексов поиск по базе знаний превращается в лотерею.

☁️

Файлы разбросаны

Часть документов в Google Drive, часть в Dropbox, что-то в OneDrive. Собрать всё в одном месте — квест.

🔄

Нет версионности

Обновили документ — как обновить запись в базе? Удалить старое, добавить новое, отредактировать существующее?

📊

Нет статистики

Сколько записей в базе? Какие таблицы активнее всего обновляются? Как работает самообучение? Полная неизвестность.

✨ Ключевые возможности

Всё что нужно для управления знаниями AI агента

📥

Мультиформатная загрузка

PDF, DOCX, XLSX, CSV, TXT, PPTX — все популярные форматы документов. Загружайте файлы напрямую или по URL из облачных хранилищ.

🤖

AI-обработка контента

Интеллектуальная фрагментация с помощью Gemini AI. Автоматическая генерация метаданных: категории, ключевые слова, темы.

🧬

768-мерная векторизация

Эмбеддинги через Google Gemini Embeddings. HNSW индексы в Supabase для молниеносного семантического поиска.

🗄️

Двойное хранение

Структурированные таблицы в PostgreSQL + векторизация в Supabase. Максимальная гибкость для любых задач.

🔒

Безопасность

API-ключ авторизация, rate limiting (30 req/min), валидация таблиц и режимов. Защита от несанкционированного доступа.

📊

Self-Learning Stats

Детальная статистика самообучения: циклы, диалоги, одобренные/отклонённые обновления, активность по таблицам.

🔄 4 режима работы

Полный контроль над данными в векторных базах

➕

APPEND

Добавление новых записей в конец таблицы без удаления существующих. Идеально для постепенного пополнения базы знаний.

Безопасное добавление

🔄

REPLACE

Полная очистка таблицы и замена всех данных новым контентом. Для полной перезаписи базы знаний.

Полная перезапись

✏️

EDIT

Обновление конкретной записи по ID. Для точечных изменений отдельных записей без затрагивания остальных.

Требует editId

🗑️

DELETE

Удаление записи по ID с каскадным удалением из связанных таблиц (document_rows, document_metadata).

Каскадное удаление

📄 6 типов файлов

Поддержка всех популярных форматов документов

📄

PDF

Extract PDF Text node

📝

TXT

Direct text extraction

📘

DOCX

ZIP → XML → Parse

📊

XLSX/XLS

Dual storage mode

📋

CSV

Table + Vector

📑

PPTX

Extract slides text

☁️ Облачные источники

Автоматическое распознавание и конвертация URL

📝

Google Docs

docs.google.com

→ DOCX export

📊

Google Sheets

spreadsheets

→ XLSX export

📑

Google Slides

presentation

→ PPTX export

☁️

Google Drive

drive.google.com

→ Direct download

📦

Dropbox

dropbox.com

→ dl=1 parameter

💾

OneDrive

onedrive.live.com

→ Direct support

🤖 AI-обработка контента

Интеллектуальная фрагментация и генерация метаданных

🧠

Модель обработки

Модель Gemini 3 Flash

Temperature 0.2

Embeddings gemini-embedding-001

Chunk Size 1500 символов

Dimensions 768

📏

Правила фрагментации

Размер фрагмента 200-1000 символов

Группировка списков ✅ Включено

Сохранение контекста ✅ Включено

Команда [FULL] Сохранить целиком

🏷️

Автометаданные

category Категория контента

keywords Ключевые слова

topic Тема фрагмента

technique Техника/метод

stage Этап воронки

🗄️ 5 Векторных баз данных

Supabase + HNSW индексы для семантического поиска

📚

knowledge_base

База знаний о продукте — цены, функции, алгоритмы

📜

interaction_policies

Политики взаимодействия — каналы, правила, ограничения

💼

sales_strategies

Стратегии продаж — аргументация, возражения, закрытие

📱

contact_capture

Методы захвата контактов — progressive disclosure

🎭

conversation_scenarios

Сценарии диалогов — use cases, эскалация, ветвление

🔗 Интеграция с Self-Learning

Полная синхронизация с системой самообучения AI агента

🧠

AI Self-Learning

→

📦

Vector Base Writer

→

🗄️

Supabase Vector

→

🤖

AI Core Agent

Замкнутый цикл улучшений

Система самообучения анализирует диалоги, генерирует предложения по улучшению промптов, валидирует их и через Vector Base Writer применяет к векторным базам. AI Core Agent сразу начинает использовать обновлённые знания. Эндпоинт /get-learning-stats показывает детальную статистику всего процесса.

💎 Преимущества системы

Почему Vector Base Writer — это правильный выбор

⚡

Быстрая загрузка

Один API-вызов для загрузки документа любого формата. Система сама определит тип и обработает.

🧠

Умная фрагментация

AI сохраняет семантическую целостность текста. Связанные мысли не разрываются посреди предложения.

🔍

Точный поиск

768-мерные эмбеддинги и HNSW индексы обеспечивают молниеносный семантический поиск.

🔄

Гибкое управление

4 режима работы — добавление, замена, редактирование, удаление. Полный контроль над данными.

📊

Прозрачная статистика

Эндпоинт статистики показывает всё: циклы обучения, обновления, активность по таблицам.

🔒

Надёжная защита

API-ключи, rate limiting, валидация. Ваши данные под надёжной защитой.

Управление базами знаний AI агента